Tecnologia Científica

Perguntas e respostas: Algoritmo realiza montagem de genoma quase completa sem sequenciamento de DNA ultralongo
Os cientistas publicaram suas descobertas na revista Nature , detalhando como o algoritmo é executado 10 vezes mais rápido do que os métodos existentes, ao mesmo tempo que produz resultados mais completos.
Por Sooyoun Tan - 16/02/2026


O DNA, que possui uma estrutura de dupla hélice, pode apresentar muitas mutações e variações genéticas. Crédito: NIH


Haoyu Cheng, Ph.D., professor assistente de informática biomédica e ciência de dados na Escola de Medicina de Yale, desenvolveu um novo algoritmo capaz de construir genomas humanos completos usando tecnologia laboratorial padrão. Sua ferramenta, chamada hifiasm (ONT), elimina a necessidade de sequenciamento de DNA, que é caro e requer 40 vezes mais material genético, além de, muitas vezes, não poder ser realizado em amostras de pacientes.

Cheng e seus colegas publicaram suas descobertas na revista Nature , detalhando como o algoritmo é executado 10 vezes mais rápido do que os métodos existentes, ao mesmo tempo que produz resultados mais completos. Essa abordagem pode tornar esse tipo de montagem de genoma acessível para diagnósticos clínicos e pesquisas anteriormente limitadas por custos e restrições técnicas.

Recentemente, você publicou na revista Nature descobertas que mostram o primeiro algoritmo capaz de realizar a montagem de telômero a telômero usando sequenciamento de DNA padrão. O que significa "telômero a telômero" e por que isso tem sido tão difícil de alcançar?

Nos genomas humanos, cada cromossomo possui dois telômeros — um na extremidade esquerda e outro na extremidade direita. " Telômero a telômero " (T2T) significa montar um cromossomo continuamente de uma extremidade à outra, sem lacunas. Em outras palavras, trata-se de uma sequência de DNA completa, de ponta a ponta, para cada cromossomo, em vez de um rascunho que ainda contém regiões faltantes.

Isso tem sido muito difícil de alcançar porque as partes restantes do genoma que ainda não foram resolvidas são dominadas por DNA altamente repetitivo.

A montagem completa de genomas T2T só foi alcançada há alguns anos, aproximadamente 20 anos após a publicação do primeiro genoma humano pelo Projeto Genoma Humano. No entanto, a produção de montagens T2T ainda requer sequenciamento de DNA "ultralongo" especializado, que é caro, tecnicamente complexo e, muitas vezes, inviável para muitas amostras clínicas ou amostras de DNA com quantidade limitada.

Seu algoritmo aborda uma importante barreira prática: a necessidade de sequenciamento de DNA ultralongo. O que tornava o sequenciamento ultralongo tão desafiador para pesquisadores e clínicos, e como sua abordagem muda esse cenário?

O sequenciamento ultralongo exige a extração e preservação de moléculas de DNA extremamente longas — imagine ter que puxar um único fio de um tecido sem quebrá-lo.

Na prática, gerar sequências ultralongas geralmente exige que os laboratórios cultivem células por semanas ou meses para obter DNA de alta qualidade em quantidade suficiente, o que não é possível com a maioria das amostras de tecido ou sangue de pacientes. Isso torna o sequenciamento ultralongo difícil de escalar, caro e inacessível para muitas aplicações práticas.

Nossa abordagem remove essa barreira ao permitir a montagem quase T2T usando dados de sequenciamento padrão que qualquer laboratório hospitalar pode preparar com protocolos de rotina de preparação de DNA. Isso poderia ser usado até mesmo em unidades de terapia intensiva, tornando a montagem completa do genoma muito mais viável na prática.

Uma das descobertas mais convincentes do seu artigo é a resolução bem-sucedida dos genes SMN1 e SMN2, que estão ligados à atrofia muscular espinhal. O que essa descoberta significa para pacientes com doenças genéticas?

Os genes SMN1 e SMN2 são um exemplo clássico de uma região de importância médica que tem sido difícil de resolver porque os dois genes são quase idênticos e estão localizados em regiões altamente repetitivas do genoma humano. Com a nossa abordagem, os médicos podem obter, de forma mais rotineira, uma visão completa da variação causadora de doenças nos genes SMN1 e SMN2.

Para os pacientes, isso pode possibilitar diagnósticos genéticos mais confiáveis ??e uma melhor interpretação do risco e da gravidade da doença. Para os médicos, reduz a incerteza e a dependência de múltiplos testes especializados, aproximando-se de uma abordagem diagnóstica abrangente e genômica.

Seus resultados mostram que essa abordagem não apenas torna a montagem T2T mais acessível, mas também produz montagens de maior qualidade, reconstruindo cromossomos mais completos em uma fração do tempo. O que tornou possível esse salto em velocidade e precisão?

Esse salto foi possível graças à combinação de dois avanços. Primeiro, a química de sequenciamento melhorou, de modo que as técnicas comuns agora são precisas o suficiente para suportar montagens de alta qualidade.

Em segundo lugar, redesenhamos o algoritmo de montagem para modelar melhor os erros remanescentes nos dados genéticos, ao mesmo tempo que aumentamos a eficiência. Imagine como se estivesse lendo um texto ligeiramente borrado — nosso algoritmo consegue identificar as letras ilegíveis reconhecendo padrões e usando o contexto das sequências adjacentes.

Olhando para o futuro, onde você acha que essa tecnologia terá o maior impacto? Existem condições médicas específicas, populações ou questões de pesquisa que poderiam se beneficiar mais com a acessibilidade do sequenciamento completo do genoma?

Na ciência básica, essa abordagem permite a construção de genomas completos e de alta qualidade a partir de diversas populações. Em vez de depender de um único genoma de referência, os cientistas agora podem estudar como o DNA difere entre milhares de pessoas de diferentes origens — incluindo genomas humanos e não humanos.

Montagens de genomas de alta qualidade são fundamentais e representam o primeiro passo para quase todas as aplicações em pesquisa genômica, possibilitando uma melhor compreensão dos padrões de saúde e doença em diferentes populações.

Em contextos clínicos, essa abordagem também pode facilitar o diagnóstico de doenças que antes eram difíceis de detectar — como os genes da atrofia muscular espinhal que discutimos anteriormente. Ela também ajuda os pesquisadores a estudar as alterações genéticas que ocorrem em uma pessoa ao longo do tempo. Por exemplo, os cientistas agora podem comparar o DNA da mesma pessoa em diferentes idades — digamos, aos 20 e aos 60 anos — para estudar o envelhecimento.

Ou podem identificar diferenças genéticas entre diferentes tecidos na mesma pessoa, como coração versus cérebro, o que ajuda a explicar por que certas doenças, como câncer ou doenças neurodegenerativas, afetam órgãos específicos. Em última análise, isso leva recursos poderosos de testes genéticos para hospitais e clínicas em todo o mundo.


Detalhes da publicação
Haoyu Cheng et al, Montagem eficiente de sequências simplex de nanoporos próximas aos telômeros, Nature (2026). DOI: 10.1038/s41586-026-10105-6

Informações do periódico: Nature 

 

.
.

Leia mais a seguir